当需要域专家来执行复杂的机器学习任务的数据注释时,减少注释工作对于缩短时间和费用至关重要。对于没有可用注释的情况,一种方法是利用特征空间的结构进行基于聚类的活动学习(AL)方法。但是,这些方法在很大程度上取决于样品在特征空间中的组织方式以及使用哪种距离度量。无监督的方法,例如对比性预测编码(CPC),可以潜在地用于学习有组织的特征空间,但是这些方法通常会产生高维特征,这对于估计数据密度可能具有挑战性。在本文中,我们将CPC和多个维度降低方法结合在一起,以搜索基于聚类的AL的功能实践。我们用于模拟语音情感识别系统部署的实验表明,该特征空间的本地和全球拓扑都可以成功用于AL,并且CPC可用于改善基于聚类的AL性能,而不是传统信号功能。此外,我们观察到,压缩数据维度并不损害AL性能,并且当注释数量不是很低时,2-D特征表示与高维表示相似。
translated by 谷歌翻译
虽然多智能体增强学习被用作学习代理之间的紧急沟通的有效手段,但现有的工作几乎专注于与离散符号的沟通。人类的沟通通常在连续声道上发生(和出现);人类婴儿通过与他们的照顾者连续的信号传导来获得语言。因此,我们问:我们是否能够通过加强学习培训的连续沟通渠道在代理之间观察到的紧急语言?如果是这样,渠道特征对新兴语言的影响是什么?我们提出了一种环境和培训方法,以作为对这些问题进行初步探索的手段。我们使用一个简单的消息环境,其中“扬声器”代理需要将概念传达给“侦听器”。扬声器配备了一个声码器,将符号映射到连续波形,这通过有损的连续通道,听众需要将连续信号映射到概念。使用Deep Q-Learning,我们表明基本的组成性以读取的语言表示出现。我们发现在传送未经证明的概念组合时,噪音在通信渠道中必不可少。我们展示我们可以通过将倾向于“听到”或“口语”英语的护理人员来实现紧急沟通。最后,我们描述了我们的平台是如何作为未来工作的起点,这些工作采用深度加强学习和多种子体系统的组合来研究我们在语言学习和出现中持续信令的问题。
translated by 谷歌翻译